বায়েস থিওরেম এবং শর্তাধীন সম্ভাবনা দুটি গুরুত্বপূর্ণ ধারণা মেশিন লার্নিং এবং পরিসংখ্যানের মধ্যে। এগুলি বিশেষভাবে ক্লাসিফিকেশন, ডেটা বিশ্লেষণ এবং সিদ্ধান্ত গ্রহণের প্রক্রিয়ায় ব্যবহৃত হয়।
১. শর্তাধীন সম্ভাবনা (Conditional Probability)
শর্তাধীন সম্ভাবনা হলো দুটি বা ততোধিক ঘটনাগুলির মধ্যে একটি ঘটার শর্তে অন্যটির ঘটার সম্ভাবনা। এটি দুটি ঘটনা A এবং B এর মধ্যে সম্পর্ক ব্যাখ্যা করে, যখন জানি যে একটি ঘটনা ইতিমধ্যেই ঘটেছে। শর্তাধীন সম্ভাবনা সাধারণত P(A|B) হিসেবে লেখা হয়, যা মানে হলো "ঘটনা B ঘটার শর্তে ঘটনা A ঘটার সম্ভাবনা"।
শর্তাধীন সম্ভাবনার সূত্র:
যেখানে:
- হল শর্তাধীন সম্ভাবনা, অর্থাৎ ঘটনা A ঘটার সম্ভাবনা, যখন ঘটনা B ঘটেছে।
- হল A এবং B উভয়ের সহগামী সম্ভাবনা।
- হল ঘটনা B ঘটার সম্ভাবনা।
উদাহরণ:
ধরা যাক, একটি ব্যাগে ১০টি বল আছে, যার মধ্যে ৩টি লাল এবং ৭টি সাদা। যদি একটি বল তুলে নেওয়া হয় এবং আমরা জানি যে এটি লাল, তাহলে লাল বল তোলার শর্তে এটি সাদা হওয়ার সম্ভাবনা কি হবে?
এখানে,
- = সাদা বল তোলার শর্তে লাল বল তোলার সম্ভাবনা।
এইভাবে শর্তাধীন সম্ভাবনা ঘটনার মধ্যে সম্পর্ক ও শর্তাধীন নির্ভরতা ব্যাখ্যা করে।
২. বায়েস থিওরেম (Bayes Theorem)
বায়েস থিওরেম হল শর্তাধীন সম্ভাবনা ব্যবহার করে একটি নতুন সম্ভাবনা অনুমান করার একটি পদ্ধতি, যা পূর্ববর্তী তথ্য (prior information) বা পূর্বধারণা (prior belief) এর ভিত্তিতে আপডেট করা হয়। এটি পরিসংখ্যান এবং মেশিন লার্নিংয়ে ব্যাপকভাবে ব্যবহৃত হয়, বিশেষত বায়েসিয়ান ক্লাসিফিকেশন পদ্ধতিতে।
বায়েস থিওরেম মূলত দুটি ধরনের সম্ভাবনা নিয়ে কাজ করে:
- পূর্বধারণা (Prior Probability): কোনও ঘটনা সম্পর্কে পূর্বে জানানো তথ্য।
- অবস্থা সম্পর্কিত তথ্য (Likelihood): নতুন তথ্য বা প্রমাণের ভিত্তিতে পূর্বের অনুমান আপডেট করা হয়।
বায়েস থিওরেমের সূত্র:
যেখানে:
- হল শর্তাধীন সম্ভাবনা, অর্থাৎ ঘটনা A ঘটার সম্ভাবনা যখন ঘটনা B ঘটেছে।
- হল ঘটনা A ঘটলে ঘটনা B ঘটার সম্ভাবনা (Likelihood)।
- হল পূর্বধারণা, অর্থাৎ ঘটনা A ঘটার সম্ভাবনা।
- হল ঘটনা B ঘটার সম্ভাবনা (এটি সাধারণত একটি নর্মালাইজিং কনস্ট্যান্ট হিসেবে কাজ করে)।
উদাহরণ:
ধরা যাক, একটি হাসপাতালের পাসে একটি ভাইরাসের প্রাদুর্ভাব হয়েছে এবং আপনি জানেন যে ১% লোকই এই ভাইরাসে আক্রান্ত হয়। হাসপাতালের পরীক্ষার মাধ্যমে, ৯৫% ভাইরাস আক্রান্ত লোক সঠিকভাবে শনাক্ত হয় এবং ১০% সঠিক না শনাক্ত হওয়া লোক থেকে ভুল শনাক্ত করা হয়।
এখন, আপনি যদি পরীক্ষা করতে চান যে, যদি কোনো লোক পরীক্ষায় পজিটিভ আসে, তবে তার ভাইরাসে আক্রান্ত হওয়ার সম্ভাবনা কত হবে?
এখানে:
- Prior Probability (P(A)): ভাইরাসে আক্রান্ত হওয়ার সম্ভাবনা ১%।
- Likelihood (P(B|A)): সঠিক শনাক্তকরণ ৯৫%।
- False Positive Rate (P(B|¬A)): ভুল শনাক্তকরণ ১০%।
বায়েস থিওরেম ব্যবহার করে আপনি শর্তাধীন সম্ভাবনা বের করতে পারবেন, অর্থাৎ, পরীক্ষায় পজিটিভ আসলে রোগী আসলেই ভাইরাসে আক্রান্ত হওয়ার সম্ভাবনা।
বায়েস থিওরেম এবং শর্তাধীন সম্ভাবনার মধ্যে সম্পর্ক:
- শর্তাধীন সম্ভাবনা হলো বায়েস থিওরেমের একটি মূল উপাদান। বায়েস থিওরেম মূলত শর্তাধীন সম্ভাবনা এবং পূর্বধারণার (Prior) মাধ্যমে একটি আপডেটেড সম্ভাবনা প্রদান করে।
- বায়েস থিওরেম শর্তাধীন সম্ভাবনা ব্যবহার করে তথ্য আপডেট করার একটি পদ্ধতি, যা পূর্ববর্তী জ্ঞানের (prior knowledge) সাথে নতুন তথ্যের (new evidence) সমন্বয় ঘটায়।
উপসংহার:
- শর্তাধীন সম্ভাবনা দুটি ঘটনা বা সিদ্ধান্তের মধ্যে সম্পর্ক বুঝতে সাহায্য করে, যখন একটি ঘটনা ইতিমধ্যে ঘটেছে।
- বায়েস থিওরেম পূর্বধারণা (prior probability) এবং শর্তাধীন তথ্যের (likelihood) মাধ্যমে আপডেট হওয়া সম্ভাবনা প্রদান করে, যা পরিসংখ্যান এবং মেশিন লার্নিংয়ের বিভিন্ন ক্ষেত্রের জন্য অত্যন্ত গুরুত্বপূর্ণ।
এটি বিশেষভাবে বায়েসিয়ান ইনফারেন্স, বায়েসিয়ান ক্লাসিফিকেশন এবং সিদ্ধান্ত গ্রহণের পদ্ধতিতে ব্যবহৃত হয়, যেখানে নতুন প্রমাণ বা তথ্যের ভিত্তিতে পূর্বের অনুমান আপডেট করা হয়।
Read more